テックポータル

テックポータル

従来の GigEVision vs CXP vs Zero Copy vs RDMA vs GPU Direct vs FPGA カード

GigEVision + GVSP

  • 15年以上の幅広い使用
  • 完全に承認された成熟した規格
  • 大規模な採用
  • UDP ベースのプロトコル
  • 真のストリーミング プロトコル
  • マルチキャストサポート
  • 必要なものがすべて揃っています
  • 高速で適切に設計された受信機が必要
従来の gigevision 対 cxp 対 ゼロコピー 対 rdma 対 GPU ダイレクト 対 FPGA カード gigevision gvsp 1

図: GVSP フレームとパケットの構造。

GigEVision の背後にあるテクノロジーを少しみてみましょう。 GVSP は、現在の標準で使用されているイーサネット ストリーミング プロトコルです。 ストリームは、複数のフレーム (または画像) で構成されます。 各フレームは、リーダー パケット、複数の画像 (またはペイロード) パケット、およびトレーラー パケットで構成されます。 すべてのパケットは、コネクションレス型プロトコルである UDP イーサネット プロトコルに従います。 これは単に、カメラはパケットを送信し、データをバッファに配置するタスクをレシーバに任せることを意味します。 コネクションレス型プロトコルであるため、ネットワーク オーバーヘッドがゼロになり、ネットワーク パフォーマンスが最大になります。 また、マルチキャストなどの基本機能がサポートされていることも意味します。 データの損失を避けるために、レシーバを適切に設計する必要があります。 CXP もこれと同じプロトコルに従い、バッファーにデータを配置するタスクをレシーバに任せます。 これにより、高品質のレシーバを使用する事で最高のパフォーマンスと最小の遅延とジッターが実現します。 一部の企業が高品質のレシーバを設計できないために、別の道をたどっていることに注意してください。

この短いアニメーションは、GigEVision ネットワーク パケットを画像に分割するプロセスを示しています。 ヘッダー、リーダー、およびトレーラーは制御プロセスによって消費されますが、画像部分は連続したメモリ バッファーに残ります。 このプロセスにソフトウェアを使用する場合、パケット全体がメモリに書き込まれ、その後、画像部分がメモリから読み出され、非フラグメント (または連続) 方法で別のメモリ位置に書き戻される必要があります。 このプロセスは、メモリ帯域幅の 3 倍のコストがかかるソフトウェアで実行することも、最適なパフォーマンスを得るためにカードのヘッダー分割機能によって実行することもできます。

従来の GigEVision + GVSP

  • メモリコピーが必要(ソフトウェアでヘッダー分割)
  • 高い CPU %
  • 3 倍のシステム メモリ帯域幅
  • 3 倍強力な PC
  • 3x PC 台数
  • 1/3 システム密度
  • 高速で適切に設計されたレシーバが必要

従来の GVSP は、ソフトウェアでヘッダー分離し GVSP パケットからヘッダーを取り除き、ペイロード パケットから画像データを連続したメモリ バッファーに配置します。 このプロセスは CPU 使用率を上昇させ、さらに重要なことに、XNUMX コピーの実装よりも XNUMX 倍のシステム メモリ帯域幅を消費します。 これにより、システムの効率が XNUMX% になり、さまざまな点でシステム コストに跳ね返ります。 これは設計があまり良くないレシーバの例ですが、市場の多くは現在も、そして XNUMXGigE でさえもこれを行っています。一部の企業では単一のサーバーで複数の XNUMXGigE カメラを使用すると問題を起こしますが、すべてレシーバの設計が不十分であることが原因です。

この短いアニメーションは、ゼロコピー (またはヘッダー分割) テクノロジを利用していないシステムの XNUMX 倍のメモリ帯域幅の使用状況を示しています。 このようなシステムでは、メモリ帯域幅が使い果たされるため、データ損失が発生する可能性があります。 データ損失は、CPU とメモリがそれ以上の転送を許可しないときにネットワーク カード内のバッファがオーバーフローすると発生します。 ちなみに、これは RDMA 支持者が従来の GigEVision と RDMA の長所と短所を議論する際に比較するものですが、これは最悪の例であるため非常に誤解を招きます。

従来の gigevision 対 cxp 対 ゼロ コピー 対 rdma 対 GPU ダイレクト 対 FPGA カード 従来の gigevision gvsp 1200x675 1

図: 従来の GigEVision + GVSP 実装におけるデータ パス。

最適化された GigEVision + GVSP

  • 真のゼロコピー
  • 市販のNIC 上でヘッダー分離 (HS)
  • 完全なカーネル バイパス
  • M&E マーケットの SMPTE 2110 において使用されている HS
  • 業界処理カードによるサポート
  • 最小のレイテンシーとジッター
  • 高品質の実装により、リセンドやフロー制御なし (必要なし)
  • GigEVision に準拠

Nvidia/Mellanox、Broadcom、Intel、Marvell の最新の NIC では、ヘッダー分割によるゼロ コピーが実際に可能です。 Emergent は、RDMA / RoCE を実験する人々が検討する主要な NIC である Nvidia/Mellanox および Broadcom を使用して実装を展開しており、相互運用性に関する懸念を解消します。 実際、Emergent はこれと同じ方法を 15 年以上使用しており、あらゆるインターフェイス標準に匹敵する信頼性を備えた最大のデザインイン密度を実現しています。 同じアプローチは、大規模なメディアおよびエンターテイメント市場向けの ST2110 にも使用されます。

従来の gigevision vs cxp vs ゼロコピー vs rdma vs GPU ダイレクト vs FPGA カード最適化ギゲターゲット書き込み e1669248604257 800x370 2
従来の gigevision vs cxp vs ゼロ コピー vs rdma vs GPU ダイレクト vs FPGA カード 最適化された Gige パートナー e1669320914421 800x304 1

図 (上): GigEVsion の最適化された実装におけるデータ パス。
図 (下): Emergent Vision Technologies のパートナー。

ゼロ コピーは、あらゆるインターフェイスやプロトコルの実装においてデータ損失がゼロであることを保証するものではありません。 どのようなパフォーマンス システムでも、望ましい結果を達成するには適切な設計とマージンが必要です。 これは、CXP、RDMA / RoCE、さらには最適化された GVSP 実装にも当てはまります。 しかし、GigEVision をポイントツーポイント プロトコルに変えたり、GigEVision を長年にわたって最も柔軟で人気のあるインターフェイスにしてきた要因を排除したりすることなく、最適な GVSP 実装が RDMA / RoCE と同等かそれ以上であることを保証できます。 RDMA の再送信機能が作動している場合、これはシステム内のバックアップの兆候であり、多くの場合、望ましくない遅延やジッターの兆候でもあることに注意することが重要です。 CXP は再送信やフロー制御を使用しないにもかかわらず、最適な受信機パフォーマンス、低遅延、低ジッターで高いデータ転送速度を維持できることを思い出していただくことも重要です。 その多くは、ゼロコピー テクノロジーと、CXP に必要な専用フレーム グラバー上の適切なバッファリングに起因すると考えられます。 低コストの NIC には十分なバッファリング機能が欠けていることがよくありますが、最新の NIC は十分な物理バッファリングを備えたコスト効率の高い価格ですぐに入手できます。

25Gbps 以上では、おなじみの PoE (パワー オーバー イーサネット) が機能しなくなることに注意してください。 したがって、新しい展開は SFP テクノロジーと分散電源システムに焦点を当てる必要があります。 また、10GigE 速度であっても、大手 NIC プロバイダーが PoE をサポートしていないことも注目に値します。そのため、カメラ ベンダーは独自のカード ソリューションを販売する必要があります。

この短いアニメーションは、ゼロ コピーを使用した、最適化された GVSP ベースのシステムのゼロ コピー メモリ帯域幅の使用状況を示しています。 このアニメーションの最初の部分では、システムが最適化されていないため、ネットワーク カード内の適切なサイズのバッファでもオーバーフローが発生していることがわかります。 アニメーションの XNUMX 番目の部分では、ゼロコピーとシステム最適化のおかげで、データは自由かつ確実に流れます。

GPU ダイレクト

  • 0 CPU および 0 システム メモリ帯域幅
  • Windows の場合 NVidia 製品には、Rivermax for Windows が必要です
  • NVidia にはパートナーシップが必要です – ほとんど選ばれません
  • Linux は標準的な GPU で GPUダイレクトに対応しています
  • 80% の MV アプリケーションは Windows を使用
  • 一部のアプリには、AOI、ドローン、VR、スポーツが含まれます
  • PC に対する要件を引き下げる
  • ピアツーピアのサポート
  • 今すぐご利用いただけます!

ゼロ コピーでは、メモリに XNUMX 回だけ書き込むことで CPU とメモリの帯域幅の使用率を最小限に抑えますが、GPU に直接書き込むことで転送を完全に回避できます。これは GPU ダイレクトと呼ばれます。 そして、多くのパフォーマンス アプリケーションでは、処理のためにデータを GPU に直接送信し、ユーザーまたはシステムとの対話のために、より低い帯域幅の結果を CPU およびメモリに取り込むことが理にかなっています。

Emergent は、さまざまなアプリケーションにおいて、Windows および Linux 上の Nvidia GPU による GPU Direct を 4 年以上サポートしてきました。 Nvidia RTXA6000/5000/4000、Orin、および Xavier は、Emergent カメラを使用する多くのアプリケーションで使用されています。

RDMA ユーザーにとって残念なことに、Nvidia/Mellanox は Windows 上で GPU Direct を許可しているのは Emergent などのパートナーを選択することだけであり、マシン ビジョン アプリケーションの 80% が引き続きこの OS に展開されています。 ただし、Linux は、すべての GPU Direct を使用する RDMA のオプションとして残ります。

この短いアニメーションは、メモリを完全にバイパスし、CPU の PCIe エンドポイントのみを使用してメモリ 0% と CPU 使用率 0% を実現する、GPU Direct を使用したゼロ転送プロセスを示しています。

FPGA

  • 0 CPU および 0 システム メモリ帯域幅
  • CPU は全く関与しません
  • Emergent が提供するネイティブ GVSP コア、またはザイリンクスなどの既存の GVSP コアを市販の FPGA カードで使用
  • 豊富なMVアルゴリズム
  • Windows と Linux のサポート
  • PC に対する要件を引き下げる
  • ピアツーピアのサポート
  • 今すぐご利用いただけます!

ゼロコピーは素晴らしいです。 GPU Direct はこれを大幅に改善します。 しかし、カメラからのデータをすべて XNUMX 枚のカードで受信して処理できれば、それは究極の成果となるでしょう。 この場合、CPU、メモリ、およびすべてのサーバー リソースはまったく使用されません。 Emergent はまさにこの目的のために AMD/Xilinx Alveo カードをサポートしており、このテクノロジを活用した複数のパフォーマンス アプリケーションを持っています。 Emergent は、Nvidia と緊密に連携して、Bluefield NIC のサポートも提供しています。 Bluefield は、Nvidia NIC と Nvidia GPU を統合したものだと考えてください。 どちらの場合も、コンピュータは主に選択したカードに電力を供給する非常にローエンドの PC にすることができます。

この短いアニメーションは、メモリと CPU を完全にバイパスしてメモリ使用率 0% と CPU 使用率 0% を実現する FPGA カード プロセスを示しています。

Emergent Vision Technologies について

Emergent Vision Technologies

Emergent の概要は次のとおりです。

  • イノベーションと高速 GigEVision イメージング運動の先駆者として 10 以上の賞を受賞
  • 10年以上の出荷 10GigE 140以上のモデルを持つカメラ
  • 5年以上の出荷 25GigE 55以上のモデルを持つカメラ
  • 2年以上の出荷 100GigE 16以上のモデルを持つカメラ
  • カメラ テクノロジー パフォーマンス リーダー
  • 高速Ethernet/GigEVision に注力
  • 高速な画像データの処理を可能にすることに注力
  • エリアスキャン および ラインスキャン モデル
  • マルチスペクトル アプリケーション用の UV、NIR、偏光、カラー、モノクロ モデル
  • アプリケーションの柔軟性を完璧にする Emergent eSDK
  • 非常に包括的なソフトウェア ソリューションのための Emergent eCapturePro
  • 高速イメージング アプリケーション向けの最も包括的な製品群とサポート
  • あらゆる速度、あらゆる解像度、あらゆるケーブル長
  • 今すぐご利用いただけます!

当社は、高速 GigEVision 製品に重点を置いた、数々の賞を受賞した企業です。

私たちは何年にもわたって、さまざまな速度で製品を出荷してきました。 10GigE 以下 100GigE.

私たちは、お客様のアプリケーションにエンドツーエンドのテクノロジーとサポートを提供することに重点を置いています。

ほとんどのアプリケーションのニーズを満たすことができます。

最後に、ここであげた製品は現在入手可能です。

10G 及びより高速な GigEVision の採用

これは、GigEVision 製品の採用の速度の範囲の簡単なスナップショットです。 10GigE 以下 100GigE. Emergent は、どのようにして最高のパフォーマンスを達成できるかを示し、そのような技術を使用するマシン ビジョンを含む多くの市場を開拓しました。 一部の企業は、25G 以上の高速製品のリリースに向けて私たちの取り組みを活用していますが、承認された高性能製品のリリースにはまだ道のりがあります。

従来のギジビジョン vs cxp vs ゼロコピー vs rdma vs GPU ダイレクト vs FPGA カード採用 e1669319825848 1200x446 1.png

図: Emergent Vision Technologies は、10GigE、25GigE、50GigE、および 100GigE インターフェイスに基づくカメラの最初のプロバイダーです。